Intelligenza Artificiale - Un Video sulla AI editing - Osservatorio BBCC Beni Culturali

Sora, la nuova IA per fare video

Dagli sviluppatori di ChatGPT, è stato presentato Sora, un nuovo sistema di intelligenza artificiale in grado di trasformare descrizioni testuali in video fotorealistici.

Basta dare anche un breve input testuale e verrà creato un video con lunghezza massima di 1 minuto. Non è ancora avviabile al pubblico, ma lo staff di OpenAI ha fornito una serie di esempi che hanno suscitato sia entusiasmo ma anche preoccupazione. 

“Stiamo insegnando all’intelligenza artificiale a comprendere e simulare il mondo fisico in movimento, con l’obiettivo di addestrare modelli che aiutino le persone a risolvere problemi che richiedono l’interazione con il mondo reale.
Vi presentiamo Sora, il nostro modello text-to-video. Sora è in grado di generare video della durata massima di un minuto, mantenendo la qualità visiva e l’aderenza alle richieste dell’utente”.

Sora Openai – Tokyo Walk

COSA FA?

Basta inserire una frase e il programma creerà un video unico. Il sistema parte generando una serie di immagini e poi le collega in modo da risultare in un filmato fluido, senza sacrificare l’alta definizione.

Sora è in grado di generare scene complesse con svariati soggetti, specifici stili, movimenti di camera e dettagli più accurati sia dei soggetti che dell’ambiente di sfondo. Il modello oltre a capire il prompt fornito dall’utente, ora comprende meglio anche come le cose esistono nel mondo fisico.

Ovviamente il programma ha ancora i suoi limiti, ha difficoltà con scene complesse, con le relazioni di causa effetto e a mettere in rapporto funzioni e uso di oggetti. Per esempio, dato un prompt che chiedeva di generare una persona mentre corre, è stato generato un video di un soggetto che corre su un tapis-roulant nel verso opposto, il programma fa fatica a relazionare leggi fisiche.

Sora Openai – Backward Jogger

Da Immagini a Video

Sora inoltre, è in grado di generare video partendo da un’immagine e un prompt.
Gli sviluppatori hanno prima generato un’immagine con un altro loro programma, Dall-e, e in seguito con Sora è stata animata, creando di fatto un video dinamico partendo da un’immagine statica.

Video Editing  

Il nuovo programma è in grado di elaborare video, può aggiungere parti in modo da creare un loop perfetto, può aggiungere azioni o aspetti e soggetti all’interno delle scene, mantenendo la qualità e lo stile grafico originale.


Fusione di Video

Un’altra funzione che mostra le capacità dell’app è la combinazione di video diversi, sostituendo i soggetti di un video inserendoli nello scenario dell’altro. Fornendo due video all’app, e inserendo un prompt dove si chiede gli aspetti da unire e da lasciare, il programma andrà a creare un video composto dei due originali. Come esempio si è mostrato un fondale marino e una via di New York, nel video composto la fauna marina “nuotava” volando nell’ambientazione cittadina.

Sora Openai – Aquarium NYC

Generare Immagini

Sora riprende la funzione di generare immagini, già esistente su Dall-e, e la migliora: ora è possibile creare immagini con diversi formati e risoluzioni, arrivando fino a 2048×2048.

Interazioni

Il sistema è stato migliorato di gran lunga, ora è in grado di generare causalità, un morso su un panino lascerà un segno, così come le pennellate su un dipinto lasciano dei nuovi dettagli sulla tela.

Rischi e aspetti etici

Dai deepfake alla disinformazione, da nuove possibilità creative ne derivano anche molti rischi. 
Deepfake, anche con contenuto di nudo, possono avere terribili ripercussioni su privati e sulle loro famiglie, nonché rovinare la loro privacy e riservatezza.
In aggiunta le “fake news” ora saranno supportate da video falsi sempre più realistici, un veloce contatto con uno di questi potrebbe distorcere le opinioni del lettore fornendo informazioni non veritiere. 

Più dell’80% degli italiani si informa attraverso il web, dove spesso si prendono le notizie così come sono, non si verifica la loro veridicità o se le fonti da cui provengono sono accreditate. Social con alta presenza di video falsi ma realistici, potrebbero alzare di gran lunga i livelli di disinformazione.

Conclusione


Sora rappresenta un grande passo innovativo nel settore dell’Intelligenza Artificiale, sarà possibile per tutti creare video complessi o editarne di già esistenti, senza usufruire di programmi costosi e senza necessitare di alte capacità di videomaking.
Come ogni programma, dovrebbe essere usato eticamente e con rispetto verso il prossimo, tuttavia questo spesso resta ancora a libera scelta dei singoli, quello dell’AI è un mondo in crescita continua ed esponenziale, di leggi ce ne sono poche e variano da stato a stato. In Europa e in Italia al momento ci sono Proposte di Legge in via di presentazione e approvazione, ancora nulla regola attivamente la gestione dei programmi AI, le varie istituzioni stanno cercando di seguire al meglio l’innovazione tecnologica per tutelare al meglio i cittadini, per il momento tocca a questi ultimi usare con parsimonia le nuove intelligenze.